Thuật toán áp dụng cho tiếng Mỹ Soundex

Vẫn tuân theo thuật toán cơ bản, nhưng có thêm các yêu cầu sau:

  1. Không quan tâm đến các phụ âm W, H, Y và các nguyên âm A, E, I, O, U.
  2. Khi có 2 hay nhiều chữ cái có cùng trọng số ở cạnh nhau, thì chỉ mã hóa một chữ cái. Ví dụ:
    • Sheppard S-163
    • Sacks S-200
  3. Một chữ cái đi ngay sau chữ cái đầu tiên và có cùng trọng số với chữ cái đầu tiên thì bỏ qua chữ cái này (không mã hóa). Ví dụ:
    • Schebowitz S-132
    • Scklar S-460
  4. 2 hay nhiều chữ cái chỉ cách nhau bởi chữ H hay W thì chỉ mã hóa một chữ cái. Ví dụ:
    • Sokwzy S-200
    • Schkolink S-452
  5. Khi một chữ cái lập lại nhiều lần và được ngăn cách bởi một hay nhiều nguyên âm A, E, I, O, U hoặc Y, ta vẫn mã hóa tất cả các chữ cái đó. Ví dụ:
    • Staten S-335
    • Simone S-550
  6. Với những từ không chứa bất kỳ chữ cái nào có một trong 6 trọng số trên - tức là sau chữ cái đầu chỉ có các chữ cái không có trọng số, ta gán toàn bộ số trọng số sau là 0. Ví dụ:
    • Shea S-000
    • Lee L-000

Tài liệu tham khảo

WikiPedia: Soundex http://genealogy.about.com/library/bl_soundex_tool... http://aspn.activestate.com/ASPN/Cookbook/Python/R... http://snippets.dzone.com/posts/show/844 http://www.archives.gov/publications/general-info-... http://patft.uspto.gov/netacgi/nph-Parser?patentnu... http://patft.uspto.gov/netacgi/nph-Parser?patentnu... http://php.net/soundex/ http://en.literateprograms.org/Soundex_(C) http://raa.ruby-lang.org/project/soundex/ https://web.archive.org/web/20080920021557/http://...